Insgesamt gibt es ca. 6500 bis 7000 Sprachen auf der Welt. Etwa die Hälfte der Erdbevölkerung sprechen eine der 10 meistgesprochenen Sprachen. Die sind Mandarin-Chinesisch, Englisch, Spanisch, Hindi, Arabisch, Portugiesisch, Bengali, Russisch, Japanisch und Deutsch.
Verschiedene Sprachen haben verschiedene Wortstellungsmöglichkeiten, zum Beispiel ist die Wortfolge auf Deutsch Subjekt-Verb-Objekt, wie im Satz “Ich koche Suppe.”, aber auf Japanisch ist die Wortfolge Subjekt-Objekt-Verb, wie im Satz: Watashi wa su-pu wo tsukuru Ich Suppe kochen
Verschiedene Sprachen haben auch verschiedene Wortstellungsmöglichkeiten in Nominalphrasen, zum Beispiel die Wortstellung von Adjektiven und Nomen in Nominalphrasen. In Deutschen ist es Adjektiv-Nomen, wie “das feuchte Holz”, aber in Französischen ist es Nomen-Adjektiv: le bois humide das Holz feuchte
Jedoch kann man nicht sagen, dass die Sprachen auf der Welt keine Gemeinsamkeiten haben. Denn alle Sprachen haben Wörter und Sätze, Wörter werden aus elementaren bedeutungslosen Lauten oder Gesten gebildet, alle Sprachen haben komplexe morphologische und/oder syntaktische Strukturen, alle Sprachen haben Frageausdrücke und Verneinungsausdrücke usw.
Es lassen sich oft universale Behauptungen nur aufstellen, wenn eine weitere Bedingung erfüllt ist: Implikationsuniversalien (vgl. W. Croft 2009). “Wenn eine Sprache L die Eigenschaft A hat, dann hat sie auch die Eigenschaft B”
Beispielsweise “Wenn eine Sprache ein [f] Laut hat, dann hat sie auch ein [s] Laut; Wenn in einer Sprache das Objekt dem Verb vorangeht”Der Hund die Katze jagt“, dann steht auch der Besitzer vor dem Besitz”des Hundes Hütte“.
Nach dieser Theorie wird in dieser empirischen Arbeit den Zusammenhangen zwischen den Wortfolgen im Satz und den Wortstellungen in Nominalphrasen von den erhobenen 26 Sprachen anschauen, ob es nach dieser Theorie auch Ausnahme gibt oder die Zusammenhangen nach Statistik signifikant sind. Diese Arbeit wird mit Statistik “R” geschrieben und alle Daten werden in “R” eingelesen und ausgewertet. Außerdem werden Karten für die Übersichten von verschiedene Themen der erhobenen Sprachen dargestellt.
Um den Zusammenhangen zwischen der Wortfolge im Satz und den Wortstellungen in Nominalphrasen in der Sprache herauszufinden, wurde einen Fragebogen mit 10-deutschen Sätzen an verschiedene Muttersprachler gegeben. Von Dezember 2017 bis Ende Februar 2018 habe ich insgesamt 26 Fragebogen von Informanten zurückbekommen. Mit diesen 26 Sprachen werden die Implikationsuniversalien genau angeschaut.
Die Überlegungen zur Wahl der Personen war, dass wir nur die Muttersprachler suchen. Denn die L2-Leaner sind meistens unsicher und brauchen Lehrbücher oder Wörterbuch, um den Übersetzungsbögen ins anderen Sprachen zu übersetzen. Aber Muttersprachler können meistens die passenden Ausdrücken in ihrer Muttersprache besser finden.
Natürlich ist es beim Erheben optimal, wenn man die Sprachen von vielen Sprachfamilien als Quellen bekommen kann, am besten auch ein paar isolierte Sprachen oder die Sprachen mit wenige Sprecher dabei könnten. Die insgesamt erhobene 26 Sprachen sind: Deutsch, Englisch, Niederländisch, Französisch, Italienisch, Griechisch, Portugiesisch, Polnisch, Russisch, Ukrainisch, Rumänisch, Armenisch, Türkisch, Tigrinja, Hindi, Vietnamesisch, Indonesisch, Kroatisch, Georgisch, Berber, Persisch und Spanisch von Mexiko.
Obwohl es nur 26 Sprachen sind, aber diese erhobenen Sprachen sind gut auf den Sprachfamilien geteilt. Es gibt nicht nur Indoeuropäische Sprachen wie Deutsch, Englisch, Niederländisch, Französisch, Spanisch, Italienisch, Griechisch, Portugiesisch, Polnisch, Russisch, Ukrainisch, Rumänisch, Hindi, Kroatisch und Persisch, sondern auch die isolierten Sprachen wie Koreanisch, Japanisch und Chinesisch. Außerdem sind die Altaische Sprachen wie Türkisch, Afroasiatische Sprachen wie Tigrinja und Berber, Sinotibetische Sprachen wie Kantonesisch, Austroasiatische Sprache wie Vietnamesisch, Austronesisch wie Indonesisch und Südkaukasische Sprachen wie Georgisch (vgl. Wals.info).
Im Folgenden werden die Daten von den erhobenen Sprachen in “R” eingelesen und schließlich wird eine Karte für eine Übersicht der erhobenen Sprachen mit diesen Daten dargestellt.
Daten <- read.csv ("//Users/verawei/Desktop/HA Sprachtypologie/sources/Umfragedaten.csv"
, header = TRUE
, sep = ";")
summary(Daten)
Sprache Land Gattung Familie
Armenisch : 1 China : 2 Romance : 5 Indoeuropäisch :16
Berber : 1 Iran : 2 Slavic : 4 Afroasiatisch : 2
Chinesisch : 1 Deutschland : 1 Germanic: 3 Altaisch : 1
Deutsch : 1 England : 1 Armenian: 1 Austroasiatisch: 1
Englisch : 1 Ethiopia Eritrea: 1 Berber : 1 Austronesisch : 1
Französisch: 1 Frankreich : 1 Chinese : 1 Chinesisch : 1
(Other) :20 (Other) :18 (Other) :11 (Other) : 4
Latitude Longitude Wortfolge Adjektiv.Nomen
Min. : 0.00 Min. :-99.38 SOV: 6 Adj+N :17
1st Qu.:32.17 1st Qu.: 10.50 SVO:20 N+Adj : 7
Median :39.00 Median : 34.00 No domiant order: 2
Mean :36.66 Mean : 41.68
3rd Qu.:47.50 3rd Qu.: 71.25
Max. :56.00 Max. :140.00
Musik.Mozart Artikel.Nomen Farbe.Nomen Numeral.Nomen Artikel.Farbe
MoMu : 9 DET+N :23 Fa+N:18 Num+N:26 DET+Fa :18
MuMo :15 N+DET : 2 N+Fa: 8 Fa+DET : 1
nicht klar: 2 nicht klar: 1 nicht klar: 7
Artikel.Numeral Artikel.Adjektiv Farbe.Adjektiv Adjektiv.Adjektiv.Umfang
DET+Num :21 Adj+DET : 2 Adj+Fa:20 Adj-U+Adj : 8
nicht klar: 1 DET+Adj :22 Fa+Adj: 6 Adj+Adj-U :16
Num+DET : 4 nicht klar: 2 nicht klar: 2
Die Analyse von den erhobenen Sprachen ist als “Umfragedaten.csv” unter Ordner “sources” gespeichert. Hier wird es mit “read.csv()” in R eingelesen und als “Daten” genannt. Mit der Funktion “summary()” kann man die Strukturen von der Datei anschauen.
In der Karte 1 werden alle erhobenen Sprachen nach ihrer Räumlichkeit auf der Weltkarte dargestellt. Mit diesem Bild sieht man, dass die erhobene Sprachen gut auf der ganzen Welt geteilt sind. Die meisten Sprachen sind von Europa, aber asiatische und afrikanische Sprachen sind auch dabei.
library(maps)
map("world", interior=FALSE, col="grey", resolution=0)
points(Daten$Longitude, Daten$Latitude
, col = "red"
, cex =.7
, pch = 20)
title (main = "Übersicht der erhobenen Sprachen ")
In Folgender Karte 2 werden diese erhobenen Sprachen nach der Sprachfamilie dargestellt. Mit dieser Darstellung kann man einen besseren Überblick über die zusammengehörige Sprachfamilie. Die erhobenen Sprachen sind gut auf den Sprachfamilien geteilt. Es gibt 16 Indoeuropäische Sprachen und zwei Afroasiatische Sprachen. Außerdem sind die Sprachfamilie Südkaukasische Sprachen, Altaische Sprachen, Austroasiatische Sprachen, Austronesische Sprache, Sinotibetische Sprachen, Chinesisch, Japanisch und Koreanisch auch dabei. Darüber hinaus kann man sagen, dass die erhobenen 26 Sprachen sehr vielfältig sind.
table(Daten$Familie)
Afroasiatisch Altaisch Austroasiatisch Austronesisch Chinesisch
2 1 1 1 1
Indoeuropäisch Japanisch Koreanisch Sinotibetisch Südkaukasisch
16 1 1 1 1
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("darkgreen", "blue", "yellowgreen", "gold", "purple", "red", "deepskyblue2", "darkblue", "darkorchid1", "green3")
mycols <- cols[Daten$Familie]
mysymbols <- c(20, 20, 20, 20, 20, 20, 20, 20, 20, 20)
Sprachefamilie <- mysymbols[Daten$Familie]
myname <- c("Afroasiatisch", "Altaisch", "Austroasiatisch", "Austronesisch", "Chinesisch", "Indoeuropäisch", "Japanisch", "Koreanisch", "Sinotibetisch", "Südkaukasisch")
points(Daten$Longitude, Daten$Latitude
, pch = Sprachefamilie
, col = mycols
)
title(main = "Übersicht der erhobenen Sprachen nach der Sprachfamilie")
legend ("bottomleft"
, legend = myname
, pch = Sprachefamilie
, col = cols
, cex = 0.7
, pt.cex = 1.5)
Um die Struktur von den Sprachen mit Farben darzustellen, habe ich zuerst mit der Funktion “table()” die Struktur von der Sprachfamilie angeschaut. Sodass ich die richtige Reihfolge von den Sprachen mit passenden Farben einordnen konnte. Die Auswahl von Farben für die Karte ist schwierig. Eine Seite sollten die näh zusammengehörige Sprachfamilie eine ähnliche Farbe bekommen, andere Seite sollten die Ortspunkte von Sprachen gut auffällig sind.
Dieser Übersetzungsbogen wurde von mir und zwei weiteren Studentinnen zusammengestellt. Mit diesem Übersetzungsbogen möchten wir herausfinden, wie bestimmte Sätze in verschiedene Sprachen aufgebaut sind, wie Superlativ und Modalpartikeln. Daher enthält der Übersetzungsbogen folgende Zehn Sätze:
Ich interessiere mich über den Zusammenhang zwischen den Wortfolgen und den Wortstellungen in Nominalphrasen der Sprachen. Für mein Analysieren sind nur folgende Satzteilen relevant:
Mit Satz 1 möchte ich die Wortfolgen im Satz von der Sprache festzustellen. Leider gibt es viele Sprachen, wenn der Subjekt im Satz “ich” ist, fällt den Subjekt weg und wird mit der Endung von Verb markiert. Daher habe ich die Wortfolgen von der Sprache immer auf alle gefragte zehn Sätzen berücksichtigt. Mit Phrase “Musik von Mozart” wird die Genitiv-Nomen-Reihenfolge analysiert, damit wird die Reihenfolge für Genitiv-Nomen oder Nomen-Genitiv in der Sprache festgestellt. Mit Sätzen 4, 5, 9, 10 werden die Reihenfolgen von verschiedenen Elementen in der Nominalphrase der erhobenen Sprachen festgestellt.
Die meisten Informanten sind meine Arbeitskollegen, Freunde oder Kommilitonen. Durch persönliche Gespräche, E-Mails und Nachtrichten von Facebook habe ich sie als Informanten gewonnen. Die Übersetzungsbogen sind entweder in ausgedrückten Papierformen an Informanten persönlich gegeben, oder als Word- und PDF-Datei an Informanten per E-Mail erreichtet. Die Informanten haben durchschnittlich ca. eine Woche gebraucht, bis sie uns die Übersetzungen zurückgeben. Viele Sprachen, wie Kroatisch, Armenisch und Rumänisch, hatten die Informanten weiter ihre Freunde für uns gefragt. Zusammenfassende kann man sagen, dass Enkodierung der Informanten nicht sehr schwierig war. Denn sie sind sehr motiviert, ihre Muttersprache für andre Person zu erklären und die Unterschieden zwischen ihre Muttersprache und Deutsch zu erkennen.
Die Umfragebogen “Umfrage Studie Sprachtypologie” ist unten Ordner “Umfrage” zu finden. Außerdem sind noch 22 erhobene Umfragebogen auch in demselben Ordner zu finden.
Die Ergebnisse der Umfragesätze sind zuerst nach Sprache analysiert. Die Wortfolge in Sätzen und die Wortstellung im Nominalphrasen sind nach jeder Sprache sehr genau berücksichtigt. Die Ergebnisse sind als Excel-Datei “Umfrage Analyse” unter Ordner sources zu finden.
Für die Analyse in R wird die Excel-Datei “Daten_Umfrage” genutzt. In dieser Analyse sind Sprache nach Land, Gattung und Familie zuerst geachtet. Außerdem sind Longitude und Latitude von der Sprache nach Wals.info für das Erstellen der Karte geachtet. Die Analyse von Daten sind außer Wortfolge unter sehr viele kleine Elementpaare geteilt, wie “Adjektiv + Nomen”, “Musik + Mozart”, “Artikel + Nomen”, “Farbe + Nomen”, “Numerale + Nomen”, “Artikel + Farbe”, “Artikel + Numerale”, “Artikel + Adjektiv”, “Farbe + Adjektiv” und “Adjektiv + Adjektiv-Umfrang”.
Im Folgenden werden nicht nur die Verteilung der Wortfolge von Subjekt, Objekt und Verb der erhobenen Sprachen in Weltkarte dargestellt, sondern auch die Wortstellungen in Nominalphrasen und die Reihenfolge von verschiedenen Arten der Adjektive in Nominalphrase der erhobenen Sprachen.
Für die Wortfolgen von Subjekt, Objekt und Verb werden nicht nur nach dem Satz 1 “Ich koche Suppe” festgestellt, sondern auch alle weitere neun Sätze von Umfragebogen.
Mit der Funktion “table()” können wir die Verteilung der Wortfolg von der erhobenen Sprachen sehen. In diesen Sprachen gibt es insgesamt sechs Sprache, die Subjekt-Objekt-Verb Wortfolge haben, und insgesamt 20 Sprache, die Subjekt-Verb-Objekt Wortfolge haben.
table(Daten$Wortfolge)
SOV SVO
6 20
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red")
mycols <- cols[Daten$Wortfolge]
mysymbols <- c(20, 20)
Wortfolge <- mysymbols[Daten$Wortfolge]
freq <- table(Daten$Wortfolge)
myname <- c(
paste0("SOV-Sprache (", freq[1], ")")
, paste0("SVO-Sprache (", freq[2], ")")
)
points(Daten$Longitude, Daten$Latitude
, pch = Wortfolge
, col = mycols)
title(main = "Die Wortfolge von Subjekt, Objekt und Verb
der erhobenen Sprachen")
legend ("bottomleft"
, legend = myname
, pch = Wortfolge
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Adjektiv.Nomen)
Adj+N N+Adj No domiant order
17 7 2
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("red", "blue", "green3")
mycols1 <- cols[Daten$Adjektiv.Nomen]
mysymbols <- c(20, 20, 20)
AdjNon <- mysymbols[Daten$Adjektiv.Nomen]
myname <- c("Adjektiv vor Nomen (17)", "Nomen vor Adjektiv (7)", "Beides (2)")
points (Daten$Longitude, Daten$Latitude
, pch = AdjNon
, col = mycols1)
title(main = "Die Reihenfolge von Adjektiv und Nomen in Nominalphrase")
legend ("bottomleft"
, legend = myname
, pch = AdjNon
, col = cols
, cex = 0.7
, pt.cex = 1.5)
Alle berücksichtige Nominalphrase:
table(Daten$Artikel.Nomen)
DET+N N+DET nicht klar
23 2 1
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("red", "blue", "green3")
mycols2 <- cols[Daten$Artikel.Nomen]
mysymbols <- c(20, 20, 20)
ArtNon <- mysymbols[Daten$Artikel.Nomen]
myname <- c("Artikel vor Nomen (23)", "Nomen vor Artikel (2)", "Nicht Klar (1)")
points (Daten$Longitude, Daten$Latitude
, pch = ArtNon
, col = mycols2)
title(main = "Die Reihenfolge von Artikel und Nomen in Nominalphrase")
legend ("bottomleft"
, legend = myname
, pch = ArtNon
, col = cols
, cex = 0.7
, pt.cex = 1.5)
Alle berücksichtige Nominalphrase:
??? NA zeigt hier in der Karte nicht… Persisch ???
Warum nicht klar? nicht eingegeben? nicht vorkommen? etc.
table(Daten$Farbe.Nomen)
Fa+N N+Fa
18 8
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("red", "blue")
mycols3 <- cols[Daten$Farbe.Nomen]
mysymbols <- c(20, 20)
FarbNon <- mysymbols[Daten$Farbe.Nomen]
myname <- c("Farbe vor Nomen (18)", "Nomen vor Farbe (8)")
points (Daten$Longitude, Daten$Latitude
, pch = FarbNon
, col = mycols3)
title(main = "Die Reihenfolge von Farbe und Nomen in Nominalphrase: roter Ball")
legend ("bottomleft"
, legend = myname
, pch = FarbNon
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Numeral.Nomen)
Num+N
26
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red")
mycols4 <- cols[Daten$Numeral.Nomen]
mysymbols <- c(20)
NumNon <- mysymbols[Daten$Numeral.Nomen]
myname <- c("Numerale vor Nomen (26)", "Nomen vor Numerale (0)")
points (Daten$Longitude, Daten$Latitude
, pch = NumNon
, col = mycols4)
title(main = "Die Reihenfolge von Numerale und Nomen
in Nominalphrase: fünf Häuser")
legend ("bottomleft"
, legend = myname
, pch = NumNon
, col = cols
, cex = 0.7
, pt.cex = 1.5)
In allen erhobenen Sprachen sind Numeral vor Nomen in Nominalphrase “fünf Häuser”, hier gibt es keine Ausnahme.
table(Daten$Musik.Mozart)
MoMu MuMo nicht klar
9 15 2
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("red", "blue", "green3")
mycols5 <- cols[Daten$Musik.Mozart]
mysymbols <- c(20, 20, 20)
MuMo <- mysymbols[Daten$Musik.Mozart]
myname <- c("Genitiv vor Nomen (9)", "Nomen vor Genitiv (15)", "Nicht klar (2)")
points (Daten$Longitude, Daten$Latitude
, pch = MuMo
, col = mycols5)
title(main = "Die Wortfolge von Genitiv und Nomen
in Nominalphrase: Musik von Mozart")
legend ("bottomleft"
, legend = myname
, pch = MuMo
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Artikel.Farbe)
DET+Fa Fa+DET nicht klar
18 1 7
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red", "green3")
mycols6 <- cols[Daten$Artikel.Farbe]
mysymbols <- c(20, 20, 20)
ArtFa <- mysymbols[Daten$Artikel.Farbe]
myname <- c("Artikel vor Farbe (28)", "Farbe vor Artikel (1)", "Nicht klar (7)")
points (Daten$Longitude, Daten$Latitude
, pch = ArtFa
, col = mycols6)
title(main = "Die Reihenfolge von Artikel und Farbe
in Nominalphrase: einen roten Ball")
legend ("bottomleft"
, legend = myname
, pch = ArtFa
, col = cols
, cex = 0.7
, pt.cex = 1.5)
??? Warum so vile “nicht klar”
table(Daten$Artikel.Numeral)
DET+Num nicht klar Num+DET
21 1 4
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "green3", "red")
mycols7 <- cols[Daten$Artikel.Numeral]
mysymbols <- c(20, 20, 20)
ArtNum <- mysymbols[Daten$Artikel.Numeral]
myname <- c("Artikel vor Numerale (21)", "Nicht klar (1)", "Numerale vor Artikel (4)")
points (Daten$Longitude, Daten$Latitude
, pch = ArtNum
, col = mycols7)
title(main = "Die Reihenfolge von Artikel und Numerale
in Nominalphrase: diese fünf Häuser")
legend ("bottomleft"
, legend = myname
, pch = ArtNum
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Artikel.Adjektiv)
Adj+DET DET+Adj nicht klar
2 22 2
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red", "green3")
mycols8 <- cols[Daten$Artikel.Adjektiv]
mysymbols <- c(20, 20, 20)
ArtAdj <- mysymbols[Daten$Artikel.Adjektiv]
myname <- c("Adjektiv vor Artikel (22)", "Artikel vor Adjektiv (2)", "Nicht klar (2)")
points (Daten$Longitude, Daten$Latitude
, pch = ArtAdj
, col = mycols8)
title(main = "Die Reihenfolge von Artikel und Adjektiv
in Nominalphrase: das feuchte Holz")
legend ("bottomleft"
, legend = myname
, pch = ArtAdj
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Farbe.Adjektiv)
Adj+Fa Fa+Adj
20 6
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red")
mycols9 <- cols[Daten$Farbe.Adjektiv]
mysymbols <- c(20, 20)
FaAdj <- mysymbols[Daten$Farbe.Adjektiv]
myname <- c("Adjektiv vor Farbe (20)", "Farbe vor Adjektiv (6)")
points (Daten$Longitude, Daten$Latitude
, pch = FaAdj
, col = mycols9)
title(main = "Die Reihenfolge von Adjektiv und Farbe
in Nominalphrase: schönen roten Ball")
legend ("bottomleft"
, legend = myname
, pch = FaAdj
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Adjektiv.Adjektiv.Umfang)
Adj-U+Adj Adj+Adj-U nicht klar
8 16 2
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red", "green3")
mycols10 <- cols[Daten$Adjektiv.Adjektiv.Umfang]
mysymbols <- c(20, 20, 20)
AdjAdjU <- mysymbols[Daten$Adjektiv.Adjektiv.Umfang]
myname <- c("Umfangsadjektiv vor Adjektiv (8)", "Adjektiv vor Umfangsadjektiv (16)", "Nicht klar (2)")
points (Daten$Longitude, Daten$Latitude
, pch = AdjAdjU
, col = mycols10)
title(main = "Die Reihenfolge von Adjektiv und Umfangsadjektiv
in Nominalphrase: schönen großen Ball")
legend ("bottomleft"
, legend = myname
, pch = AdjAdjU
, col = cols
, cex = 0.7
, pt.cex = 1.5)
Vermutungen
Folge1 <- table(Daten$Wortfolge, Daten$Adjektiv.Nomen)
Folge1
Adj+N N+Adj No domiant order
SOV 5 1 0
SVO 12 6 2
barplot (Folge1
, main = "Zusammenhang zwischen den Wortfolgen und
die Wortstellung des Adjektivs und Nomen"
)
Der Unterschied zwischen den Sprachen kann man auch mit einem Boxplot darstellen, aber das hilft nicht so viel, weil jeder Vokal anders ist.
mosaicplot(Folge1
, color = TRUE
, xlab = "Wortfolge"
, ylab = "Wortstllung der Adjektiv und Nomen"
, main = "Zusammenhang zwischen den Wortfolgen und
den Wortstellungen der Adjektiven und Nomen")
chisq.test(Folge1)
Chi-Quadrat-Approximation kann inkorrekt sein
Pearson's Chi-squared test
data: Folge1
X-squared = 1.2891, df = 2, p-value = 0.5249
t.test(Folge1)
One Sample t-test
data: Folge1
t = 2.4058, df = 5, p-value = 0.06118
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-0.2968864 8.9635531
sample estimates:
mean of x
4.333333
???
cor.test(Folge1, Folge1)
Pearson's product-moment correlation
data: Folge1 and Folge1
t = Inf, df = 4, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
1 1
sample estimates:
cor
1
Folge2 <- table(Daten$Wortfolge, Daten$Artikel.Nomen)
Folge2
DET+N N+DET nicht klar
SOV 5 0 1
SVO 18 2 0
mosaicplot (Folge2
, color = TRUE
, xlab = "Wortfolgen"
, ylab = "Wortstellung von Artikel und Nomen"
, main = "Zusammenhang zwischen den Wortfolgen und
den Wortstellungen der Artikel und Nomen ")
chisq.test(Folge2)
Chi-Quadrat-Approximation kann inkorrekt sein
Pearson's Chi-squared test
data: Folge2
X-squared = 3.9565, df = 2, p-value = 0.1383
t.test(Folge2)
One Sample t-test
data: Folge2
t = 1.5278, df = 5, p-value = 0.1871
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-2.957538 11.624205
sample estimates:
mean of x
4.333333
cor.test(Folge2, Folge2)
Pearson's product-moment correlation
data: Folge2 and Folge2
t = Inf, df = 4, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
1 1
sample estimates:
cor
1
Folge3 <- table(Daten$Wortfolge, Daten$Farbe.Nomen)
Folge3
Fa+N N+Fa
SOV 5 1
SVO 13 7
mosaicplot (Folge3
, color = TRUE
, xlab = "Wortfolgen"
, ylab = "Wortstellung von Farbe und Nomen"
, main = "Zusammenhang zwischen den Wortfolgen und
den Wortstellungen der Farbe und Nomen ")
chisq.test(Folge3)
Chi-Quadrat-Approximation kann inkorrekt sein
Pearson's Chi-squared test with Yates' continuity correction
data: Folge3
X-squared = 0.12187, df = 1, p-value = 0.727
t.test(Folge3)
One Sample t-test
data: Folge3
t = 2.6, df = 3, p-value = 0.08038
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-1.456116 14.456116
sample estimates:
mean of x
6.5
Folge4 <- table(Daten$Wortfolge, Daten$Numeral.Nomen)
Folge4
Num+N
SOV 6
SVO 20
mosaicplot (Folge4
, xlab = "Wortfolgen"
, ylab = "Wortstellung von Numerale und Nomen"
, main = "Zusammenhang zwischen den Wortfolgen und
den Wortstellungen der Numerale und Nomen ")
chisq.test(Folge4)
Chi-squared test for given probabilities
data: Folge4
X-squared = 7.5385, df = 1, p-value = 0.00604
t.test(Folge4)
One Sample t-test
data: Folge4
t = 1.8571, df = 1, p-value = 0.3145
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-75.94343 101.94343
sample estimates:
mean of x
13
Kritik In vielen Sprachen sind die Bedeutung von jedem Wort nicht klar markiert oder geschrieben, wie Persisch, Koreanisch. Man kann nur mit Wörterbuch und Google Übersetzer die Bedeutung vom einzelnen Wort raussuchen, aber meistens ist man unsicher. Daher kann man nur die Art von Wort feststellen, nicht die genaue Bedeutung und Feinheit.
Satz 1: Ich koche Suppe. In Vielen Sprachen wird der Subjekt nicht eingegeben, wenn es “ich” ist. “Ich” als Subjekt wird in der Endung von Verb makiert.
Kritik: 1 Nur mit ein paar Sätzen von Übersetzungen kann man nicht alle Variationen von einer Sprache bekommen, sondern nur die passende Form von diesem Satz. Das bedeutet noch lange nicht, dass andere Form in dieser Sprache nicht gibt.
2 Die im Text vergleichende Reihfolgen sind auch nicht unbedingt so ausgedrückt in der Sprache in allen Ausdrückssituationen.
Jedoch gibt es uns eine gute Überblick von Sprachen der Welt, dass die Sprache sehr vielfältig sind und doch einen Zusammenhang mit einandern haben.